查看原文
其他

老姚专栏 | 体悟假设检验之道

姚耀军 数据Seminar 2022-12-31


启研学社由知名学者担任学术顾问,高校师生与企研数据科学团队联合组建,以大数据资源及相关技术助力中国学术与智库研究为宗旨的研究组织。团队当前的主要目标是挖掘经济社会大数据资源在学术和智库领域的应用价值,开展学术大数据治理研究,以及探索大数据分析技术融入中国经济社会研究的可行进路。

假设检验是现代统计学的基础与核心之一。然而,传统统计学教科书大多重于术而轻于道,强调具体操作流程,忽视对其所蕴含科学思维的介绍,结果令不少初学者纠结于P值、一类与二类错误等技术细节,无法掌握假设检验之精髓。本文不揣浅陋,试图为初学者体悟假设检验之道提供一个简单的指引。


01

假设检验体系设定的经济学

启研学社

经济效率是制度安排的底层逻辑。有趣的是,假设检验中对原假设与备择假设的设定,亦符合经济效率法则。简单来说,所谓假设检验体系设定的经济学,就是指最小化举证反驳或者说证伪的成本。以“房间里是否有跳蚤”这个问题为例,我们来看看如下两种假设体系设定方式:

方式一是:

原假设为“房间里有跳蚤”,而备择假设为“房间里无跳蚤”。我们注意到,反驳原假设可能面临着巨大的举证成本——由于在某一个角落未发现跳蚤并不意味着跳蚤不会出没于其他角落,我们或许不得不将房间每个微小角落都仔细搜寻一遍。

方式二是:

原假设为“房间里无跳蚤”,而备择假设为“房间里有跳蚤”。显然,反驳这个原假设所涉及的举证成本相对较小,因为只要从任何一个角落发现跳蚤,就有力地反驳了原假设。

在统计学中,方式二是设定假设检验体系的标准方式。不过从节省举证反驳成本层面考虑,也应将那些更容易收集证据对其进行反驳的命题设定为原假设,让其直面证据的考验。值得指出的是,这也符合科学研究中的证伪原则。所谓证伪原则,是指科学假说应具有可证伪性,亦即存在被经验证据反驳的可能性。显然,若一个命题的举证反驳成本很高,以致举证反驳不可行,则将这个命题设定为原假设就不满足证伪原则。

假设检验的经济学亦体现了反证法作为一种科学研究方法的精妙之处。原假设与备择假设构成了一个非此即彼的完备假设体系,而一旦原假设被驳倒,就自然表明备择假设获得了证据支持。因此,当备择假设很难被证据直接反驳时,从容易被反驳的原假设入手进行反证,无疑是一个节约论证成本的好主意。


02

假设检验结论表述的严谨性

启研学社

如果原假设被驳倒,我们自然放弃原假设。然而,在原假设未被驳倒的情况下,我们却不能接受原假设,而其原因是:第一,现实中,我们总是基于有限样本进行归纳,然后才发现原假设未被驳倒。但我们并不知道,一旦扩大样本容量,结论是否会反转。就前文例子而言,我们在房间多个角落均未发现跳蚤,并不意味着房间其余地方无跳蚤。第二,我们并不能保证,检验方法足够精细,以致任何一只“跳蚤”都难逃其“火眼金睛”。按照统计学术语,就是检验方法不能确保具有100%的势(Power)。

当原假设未被驳倒时,我们只能说“不拒绝”原假设,从而意味着备择假设不一定为假。但是,原本容易收集证据对其进行反驳的原假设最后竟然未被驳倒,这一事实又的确十分清楚地表明,备择假设缺乏有力的证据支持。对于统计学初学者,上述表述也许有些微妙——难道备择假设缺乏有力证据并不意味着备择假设为假?

是的,备择假设缺乏有力证据并不意味着备择假设为假。假若我们将备择假设缺乏有力证据与备择假设为假混为一谈,就陷入了“诉诸无知”这一著名的非形式逻辑谬误。该谬误是指,人们仅因无证据表明一件事物是错误的,就断定其正确,或者仅因无证据表明一件事物是正确的,就断定其错误。科学哲学中也有一句格言,提醒人们警惕“诉诸无知”谬误,那就是:

“缺乏证据不是证伪的证据(Absence of evidence is not evidence of absence)。”


03

假设检验与法律判决的相通性

启研学社

假设检验与法律审判遵循相同的经济效率法则。按照“无罪推定”原则,犯罪嫌疑人“无罪”是法律判决的原假设,此时应由控方承担举证反驳责任。然而,若以“有罪”为原假设,则犯罪嫌疑人就须自证清白。与个人收集证据自证清白相比,控方作为司法机构,收集罪证一般来说更容易。因此,“无罪推定”原则符合假设检验的经济学。值得指出的是,假若不坚持“无罪推定”原则,则原本无辜的犯罪嫌疑人可能会因自证清白成本过高而放弃为自己申辩,以致酿成冤案。若“无罪”作为原假设被驳倒,则犯罪嫌疑人将沦为罪犯而被收监。反之,则犯罪嫌疑人将被无罪释放。然而,“无罪”并不等价于“清白”——无罪释放仅意味着,目前无证据表明犯罪嫌疑人有罪。缺乏犯罪的证据并不表明犯罪嫌疑人就是清白的,这与我们之所以“不拒绝”而非“接受”未被证据所驳倒的原假设,在道理上完全相通。鉴于假设检验与法律判决相通,很多统计或计量经济学教科书乐于对两者进行类比。例如,计量经济学家简·克曼塔(Jan Kmenta)在一本教科书中写道:

“正如一个法庭宣告某一判决为‘无罪(Not guilt)’而不为‘清白(Innocent)’,统计检验的结论也应为‘不拒绝(Not reject)’而不为‘接受(Accept)’。”


结语

科学研究就是去伪存真,而假设检验是实现此过程的基本方法。虽然假设检验体系包括原假设与备择假设,但真正的关注点其实是后者。论证备择假设是否成立须让证据说话,而只有那些驳倒了原假设的证据,方可称已对备择假设提供了坚实的证据支持。这种为备择假设寻找证据支持的思路,既符合经济效率原则,也体现了科学研究的严谨性,亦与现实生活中的法律判决相通。老子曰:“有道无术,术尚可求也;有术无道,止于术。”庄子曰:“以道驭术,术必成。离道之术,术必衰。”希望本文有助于读者朋友更好地体悟假设检验之道。




1

END

1




企研数据创始学术顾问 · 耀军



姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授,博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,企研数据创始学术顾问。曾获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。研究领域:金融发展理论与实证、应用计量经济学。

邮箱:yaoyaojun@163.com

代表论文:

[1]姚耀军,施丹燕.互联网金融区域差异化发展的逻辑与检验——路径依赖与政府干预视角[J].金融研究,2017(05):127-142.

[2]姚耀军.制度质量对外资银行进入的影响——基于腐败控制维度的研究[J].金融研究,2016(03):124-139.

[3]姚耀军,董钢锋.中小企业融资约束缓解:金融发展水平重要抑或金融结构重要?-来自中小企业板上市公司的经验证据[J].金融研究,2015(04):148-161.





点击阅读原文进入CCAD数据库



·END·


星标⭐我们不迷路!

想要文章及时到,文末“在看”少不了!


点击搜索你感兴趣的内容吧


往期推荐


因果推断 | 一文读懂倾向匹配得分Stata及R操作应用

数据分享丨中国农产品加工业发展进程和成就:中国农产品加工业年鉴(1978-2018)

机器学习 | 经济学中的数据科学:机器学习与深度学习方法

好享学 | 小而简单的图表,大而复杂的世界

数据分享 | 2020年《中国工业经济》三农及环境领域文章所用数据集?(附数据资源)

推荐 | 保罗·克鲁格曼:我的工作方法

好享学 | 祖师爷敲门教你可视化基础:图形与符号








数据Seminar




这里是大数据、分析技术与学术研究的三叉路口



文 | 姚耀军

排版编辑 | 青酱



    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存